بررسی عوامل موثر در خلاصه سازی خودکار متون خبری فارسی با تاکید بر نشانه های گفتمانی و بر پایه دستور نقش گرا

پایان نامه
چکیده

هدف این پژوهش، بررسی عناصر زبان شناختی موثر بر بهبود خلاصه سازی خودکار متون خبری فارسی در صفحات وب با تاکید بر نشانه های گفتمانی با رویکرد میان رشته ای است. چارچوب نظری این تحقیق، مبتنی بر آرای مایکل هالیدی زبان شناس نقش گرا درباره انسجام متنی است. همچنین تلفیقی از نظریات زبان شناسان در خصوص نشانه های گفتمانی در چارچوب تئوریک مدنظر قرار گرفته و در روش شناسی از مدل ادمونسون در خلاصه سازی استخراجی استفاده شده است. اهم نتایج حاصل از بررسی 180 رویداد خبری و 1295 «پاراگراف» موجود به عنوان واحد تحلیل، بر روی وب سایت خبرگزاری ایسنا در قالب موضوعات اجتماعی، اقتصادی، سیاسی، فرهنگی و ورزشی طی شش ماهه نخست سال 1390 به شرح زیر است: - کل نشانه های گفتمانی موجود در متون خبری 6283 نشانه بوده است که 463 مورد، نشانه گفتمانی بدون تکرار در قالب 14 نوع نشانه در اخبار مورد بررسی شناسایی شده اند . - از میان نشانه های گفتمانی مورد بررسی، نشانه های ساختاری، فعلی، افزایشی و علتی مجموعا بیش از 75 درصد نشانه ها و عبارات پیوند دهنده جملات و پاراگراف های متون خبری را به خود اختصاص داده اند. - رویدادهای تک خبری در مقایسه با رویدادهای چند خبری در خلاصه سازی استخراجی کاربرد بیشتری دارند. - در 50 درصد اخبار مورد بررسی، پاراگراف دوم خبر به عنوان مهم ترین پاراگراف برای خلاصه سازی استخراجی به شمار می رود و در 18 درصد اخبار، پاراگراف آخر برای خلاصه سازی مناسب تر است. ضمن آنکه در 32 درصد اخبار امکان وزن دهی به پاراگراف ها و در نتیجه تعیین پاراگراف مهم برای خلاصه سازی میسر نیست. - از مجموع نتایج به دست آمده دو مفهوم «نانو خبر» و «زبان شناسی خبر» پیشنهاد شده که برای نخستین بار در حوزه خلاصه سازی مورد استفاده قرار گرفته است. نتیجه آنکه بین نشانه های گفتمانی موجود در متون خبری و نقش آنها در بهبود خلاصه سازی صفحات وب رابطه معنادار وجود دارد. کلمات کلیدی: خلاصه سازی خودکار، خلاصه سازی استخراجی، نشانه های گفتمانی، میان رشته ای، انسجام متنی، زبان شناسی رایانه ای، زبان شناسی خبر

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

مقایسه تأثیر وضعیت طاق باز و دمر بر وضعیت تنفسی نوزادان نارس مبتلا به سندرم دیسترس تنفسی حاد تحت درمان با پروتکل Insure

کچ ی هد پ ی ش مز ی هن ه و فد : ساسا د مردنس رد نامرد ي سفنت سرتس ي ظنت نادازون داح ي سکا لدابت م ي و نژ د ي سکا ي د هدوب نبرک تسا طسوت هک کبس اـه ي ناـمرد ي فلتخم ي هلمجزا لکتورپ INSURE ماجنا م ي دوش ا اذل . ي هعلاطم ن فدهاب اقم ي هس عضو ي ت اه ي ندب ي عضو رب رمد و زاب قاط ي سفنت ت ي هـب لاتـبم سراـن نادازون ردنس د م ي سفنت سرتس ي لکتورپ اب نامرد تحت داح INSURE ماجنا درگ ...

متن کامل

بهبود خلاصه سازی خودکار متون فارسی با استفاده از روش‌های پردازش زبان طبیعی و گراف شباهت

A significant amount of available information is stored in textual databases which contains a large collection of documents from different sources (such as news, articles, books, emails and web pages). The increasing visibility and importance of this class of information motivates us to work on having better automatic evaluation tools for textual resources. The automatic summarization of tex...

متن کامل

خلاصه سازی خودکار متون فارسی مبتنی بر هستی شناسی

با توجه به گسترش روزافزون اطلاعات در دسترس از طریق اینترنت، لزوم استفاده از روش های خلاصه سازی خودکار متن، بیش از پیش احساس می شود. روش هایی که با استخراج مهمترین مطالب موجود در اسناد مانع از مطالعه کامل حجم انبوه از آنها شوند. خلاصه سازی عبارت است از فشرده سازی متن (متون) منبع و تولید یک نسخه کوتاه تر از آن به نحوی که محتوای اطلاعاتی آن حفظ شود. اغلب سیستم های خلاصه ساز با استفاده از روش های س...

15 صفحه اول

سیستم خودکار خلاصه ساز متون فارسی

دراین پژوهش روشی ترکیبی از الگوریتم ژنتیک و شبکه عصبی rbf برای خلاصه سازی استخراجیِ متون فارسی پیشنهاد شده است، که ابتدا به امتیازدهی پاراگراف ها پرداخته می شود، سپس پاراگراف های برتر را انتخاب کرده و به محاسبه امتیاز جملات آن ها می پردازد. همچنین جهت تعیین میزان اهمیت هر یک از ویژگی های جملات از یک شبکه عصبی mlp بهره گرفته شده است. سپس با استفاده از یک شبکه عصبی rbf به گزینش جملات برتر به عنوان...

عوامل موثر بر کاربرد فن‌آوری اطلاعات با تاکید بر کتابخانه‌های دانشگاهی : پژوهشی در متون

سرمایه‌گذاری سازمان‌ها در زمینه‌ فن‌آوری اطلاعات از دهه گذشته به طرز قابل توجهی افزایش یافته است. در این میان کتابخانه‌ها نیز از آثار فن‌اوری اطلاعات بی نصیب نمانده‌اند، به طوری که استفاده از فن‌آوری اطلاعات در کتابخانه‌ها – به ویژه کتابخانه‌های دانشگاهی و تحقیقاتی – سبب ارتقاء کارکرد کتابخانه‌ها و قابلیت خدمت رسانی آنها می‌گردد. اما تحقیقات گوناگون، بازدهی این سرمایه گذاری‌ها و میزان نیل به اه...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه سیستان و بلوچستان - دانشکده ادبیات و علوم انسانی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023